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ВВЕДЕНИЕ 


Эта работа - расширение известного МДМ-метода для решения общей 


квадратичной задачи математической диагностики на задачу мягкого отделения. 


1. Постановка задачи 


Усеченной выпуклой оболочкой (КСН) п точек р; с усекающим козффи- 


циентом у называется множество 
т, т, 
Вы) ші жрі|0 З цс р, У ре (1.1) 
1—1 1—1 
На и накладывается естественное ограничение 


1 
Е (1.2) 
т, 


Когда и = 1. ВСН очевидно содержит единственный элемент - центр масс 
злі 


множества. 

Пусть в пространстве К” с евклидовой нормой есть векторы р; и заданы 
множества Р = {р;} ти Р» = {р} „1. Пусть В; - КСН(Р)), Б» - ВСН(Р,). 
Наша цель - найти вектор кратчайшего расстояния между Ал, Д», то есть такие 
101, 42, ЧТО 


| ши — 15| > оп. (1.3) 
1 Е Вл, м2 Є Б», 


При этом для любого решения 4/1, и разность 7 = и — шо одинакова. Основой 
алгоритма является МДМ-методі| ЇЇ. 
2. Описание алгоритма 
Пусть уже есть некоторое приближение т, 1%: 
5 1—8 
и = \ [Ри] є Вт, шо = \ 91Р] Е Б». (2.1) 


1=1 $=1 


Введём для обеих КСН вспомогательные множества: 


М = {Ли > 0}, М = {Ли < в}. (2.2) 
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Вычислим сі = {(РИЙ, чл — шо) Р) з, са = {(Р[], иә — ил) 77, пропорцио- 
нальные проекциям вектора кратчайшего расстояния на элементы множеств. 


Найдем для обоих наборов индексы о є М (0 и є М (2) такие, что: 


тіп сь = сь], (2.3) 


ыы 


ах ск = с 


птах 


Пусть Ах = ск 


= с 

Если А! = А, = 0, данные приближения - решение (показано далее). Процесс 
окончен. 

Иначе для большего из Д, "сместим" соответствующий ему и. в направлении 


пит тах 


ры" — рь," (то есть от элемента с наибольшей проекцией к элементу с 


наименьшей, передав тому часть коэффициента первого) на величину 


З Д тах АТ 
а= тіпі( | аа ШЕЕ И (2.4) 


Прке") — ры 


Оптимальность выбора 4 будет показана далее 


Коэффициенты и |з| разложения 10, по Р, [| изменятся таким образом: 


и] при 5 и е 


шр [$] = 4 и, [3] + 4 при з = т", (2.5) 


и. [$] — 9 при $ = 37%. 


Выполним следующую итерацию с обновленным ау. 


3. Формализация 


Запишем двойственную задачу к (1.3). 


5 (АТ Ди, и) — >, ш; Э тіп, 
З бш = 0, (3.1) 


Оси 7 17, 


где &; = 1 приз ЕТ: зиё; = —1 приз Е з +1: т, 

11:8, Из+1:т - КОЭффициенты разложения приближения 101, и» по векторам из р., 
и рз+1:т соответственно, 

А - матрица со столбцами &1р1...бтрт. 


Покажем, что действительно А! = А» = 0 < план ил, ш» - оптимален. 


Доказательство. Сформулируем для задачи условие Каруша-Куна-Таккера!: 


АТАи - е з оё + У) Ве; - Уе, 
1=1 1-1 

Буцу = 0,8) > 0, ДЕТ: т, 

уи — шщ) = 0,7 20, Е 1: т, 


а, 9, у — наборы двойственных переменных, е — единичный вектор длины т 
(3.2) 


Аналогично представленным в предыдущей части (2.2) М (0, м? введём 


вспомогательные множества 


1 Подробно о двойственной задаче и условии ККТ: хуч . сз. сша.еда/-ввотдоп/10725-Е12/5114ез/16-КК®. 


І = {јє1: м, = 0}, 10 = {]ЕТ: 0 < и < и}, 
ГО = {у є1: зщ; = и}, зе 
І = {јєѕ+1: ти; = 0), І? = {1 Ез+1: тои, < и}, 
19 = {1 ЕЗ-+Т: ти = шр. 
Обозначим ш = ш — шо = Аи = У) ё;и;р:. Тогда АГАи = (рі, х). Условие 


1=1 
(3.2) примет вид: 


1+ ас; + В; приз Є ІФ ) и) 


(р, ш) = 41 + аё приї Є в ) ІФ), (3.4) 


1 + аб; — у; при і Є 1 ОЗ), 


В текущих обозначениях использовавшиеся в Ат и Д» выглядят следующим 


образом: 


А = тах 1. Ш) — тіп :. Ш) 3.5 
1 10) хр ) 1% пре | ( ) 
Ж = тах 1. 0) — тіп 1. 1). 3.6 
2 І? х РЬ ) 10) пов ) ( ) 


Теперь очевидно, что А „ах = 0 < выполнено условие (3.2). 


Покажем также оптимальность выбора смещения 4 (2.4) на заданной ите- 


рации с приближением 10. 


Доказательство. Пусть А! > А». Обозначим 


о(9) = 0 (ру Рр), ЧЕ [иде 7) 


Тогда 


(а)? = о? — 24А: + Фр — рун] (3.8) 
Абсолютный минимум || «(4)||? достигается при 
А! 
йт, (3.9) 
тае — Рт 


Из определения ВСН (1.1) и описанием смещения (2.5) очевидны неравенства 


И рот — Ш я 7 = И утат, (3.10) 
Поэтому 
| ПАМ 
д = тіпі( ; Шітах, [4 — Шт }. (3.11) 
у — Рут Із Л Л 


Случай Д» > Д; рассматривается аналогично. 


4. Сходимость алгоритма 


Наш алгоритм является обобщением МДМ-метода для решения общей 
квадратичной задачи математической диагностики (и = 1), чья сходимость 
доказана в [2]. Сходимость представленного алгоритма проверена эвристически. 


5. Связь с мягким 5УМ-отделением 
Задача мягкого 5УМ-отделения ставится следующим образом [4]: 


1 _ | 
БШ У п; = п, 
ј=1 


5.1 
Сара ОЗ І-т, ет кн 


20, ТЕЛ. 


Здесь 7; характеризует величину ошибки на р;. Двойственная к этой задаче 


совпадает с (3.1) [5]. 


Пусть Э и, шо решение задачи (1.3). Пусть ш = и — шо. По теоремам двой- 
ственности у задачи (5.1) есть решение ш", 0", причём 1 - компонента ш" этого 


решения. 


Из условий (5.1) 


В > -(ш',рі), 1ЕТ:5, 
(5.2) 
В < —{и,р), 1Е (8-1): т, 
откуда 
тах{1 — (м, р;)} < 8* < тіп 1-1- (ш", рі). (5.3) 


4Е1:8 Е (8-+1):т 
Таким образом представленный алгоритм может применяться для решения за- 
дачи нестрогого отделения. 


6. Практическое применение 


Алгоритм позволяет решать широкий спектр задач и в частности имеет 
большое применение в машинном обучении. В задаче классификации является 
аналогом алгоритмов 5УМ-Пері и 5МО. 

Рассмотрим задачу бинарной классификации. Пусть есть множество объ- 
ектов С, каждый из которых относится к одному из двух классов, но информация 
об отношении объектов к классу есть лишь для Н с С. Есть также признаковое 
пространство Е и отнощения А : С > Е В: Н -» {0, 1}. Пользуясь этим, 
требуется восстановить С : С -» {0,1}. 

Если множества соответствующих объектам признаков линейно разделимы, 
задачу можно решить, применив МДМ, 5УМ-П 26, 5МО методы. 
Классический способ решения нелинейной задачи такими алгоритмами - преоб- 
разовать признаки из Ё таким образом, чтобы линейное разделение всё же было. 
Часто это приводит к увеличению размерности Е. 

Описанный в работе метод позволяет разделять линейно неразделимые мно- 


жества (рисунок |1) с сохранением размерности и удалением из рассмотрения 


наиболее вырожденных элементов (рисунок [2). Мерой вырожденности можно 
считать удалённость элемента от центра масс множества. 
Помимо изложенного, в рамках работы реализованы классификатор мно- 


жеств в В" на основе описанного метода и визуализатор результатов классифи- 


кации (рисунок [3), (рисунок М). 
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ПРИЛОЖЕНИЯ 


Рисунок 2 — Усечение: появилась возможность линейного разделения 
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Рисунок 3 
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